Boom metrics

Цифровое бессмертие для языка: как «Яндекс.Переводчик» помогает сохранить лингвистическое многообразие страны

В него включено уже 18 языков народов России
Фото: ФАДН России.

Фото: ФАДН России.

В глобальном мире будущее любого языка решается в цифровом пространстве. Если его нет в интернете, в поисковиках и популярных сервисах, он рискует остаться на периферии современной жизни. Особенно для молодого поколения. А если молодежь не говорит на языке родителей, то нарушается его межпоколенческая передача. Будущее языка оказывается под вопросом. Осознание этого факта стало отправной точкой для масштабного проекта, который с 2023 года реализует Дом народов России при поддержке Федерального агентства по делам национальностей (ФАДН) России. Его цель — дать языкам народов России равные возможности для развития в киберпространстве, начав с их интеграции в крупнейший отечественный сервис онлайн-перевода.

Фото: ФАДН России.

Фото: ФАДН России.

В работе 35 языков

Инициатива родилась благодаря простому анализу языковой ситуации . Тимур Цыбиков, начальник Управления государственной политики в сфере межнациональных отношений ФАДН России, вспоминает: «Несколько лет назад мы обратили внимание на то, что в крупнейшем отечественном сервисе онлайн-перевода «Яндекс Переводчик» представлено всего 8 языков народов России, что явно свидетельствовало о цифровом неравенстве языков в киберпространстве». При том, что в стране, по официальным данным, насчитывается около 150 языков, в онлайн-переводчик было погружено лишь 5% от этого богатства.

Ответом стало создание рабочей группы при ФАДН России, которая координирует работу на местах. В нее вошли представители правительств регионов, научных институтов и, что особенно важно, языковые активисты. Сегодня группа объединяет 20 регионов РФ и две общественные организации, а работы ведутся над 35 языками. «Важно, что в их числе оказались не только языки с большим количеством носителей, но и 5 языков коренных малочисленных народов Севера, Сибири и Дальнего Востока, которые считаются особо уязвимыми», — подчеркивает Тимур Цыбиков.

«Этот проект стал возможным благодаря сотрудничеству всех, кто сегодня не равнодушен к вопросам сохранения языков народов России, - сообщила начальник отдела поддержки и реализации языков народов России Дома народов России Фериде Арония. - Мы работаем и с органами власти, и крупными компаниями, общественными организациями и языковыми активистами. Когда мы только начинали, было довольно не просто найти поддержку. Но сегодня уже нет сомнений в необходимости цифровизации языков народов России, - и этот проект, и другие наши инициативы находят отклик и новых партнеров на совершенно разных уровнях».

Представитель Дома народов России отметила, что в прошлом году организация впервые провела мониторинг состояния и развития языков народов России в сфере информационных технологий. Полученные результаты говорят о том, что языки сегодня не обеспечены равными условиями в цифровом пространстве.

«Поэтому впереди у нас еще очень много работы, - убеждена Фериде Арония. – И для обсуждения всех актуальных вопросов государственной политики в сфере поддержки языков народов России в киберпространстве мы с компанией «Яндекс» в 2024 году инициировали совместное мероприятие, - стратегическую сессию «Информационные технологии и языки народов России», которая уже стала ежегодной.

Фото: ФАДН России.

Фото: ФАДН России.

От осетинского до языка манси

Первым «новобранцем» проекта в 2024 году стал осетинский язык. «Этот видимый результат вдохновил нас, наших партнеров и, конечно, коллег из регионов», — вспоминает представитель ФАДН. Вслед за ним в 2025 году в сервисе появилось сразу 10 новых языков: абазинский, бурятский, кабардино-черкесский, карачаево-балкарский, коми, мансийский, ногайский, тувинский, мокшанский и эрзянский. Особой вехой стало включение мансийского — первого языка коренных малочисленных народов Севера в Яндекс.Переводчике.

«Когда язык с небольшим количеством носителей появляется в одном ряду с крупнейшими мировыми языками, да еще и в сервисе такого гиганта, как Яндекс – это мощнейший импульс», — говорит Михаил Русанов, руководитель центра развития искусственного интеллекта Югорского НИИ информационных технологий. По его словам, это меняет восприятие: «Язык перестает восприниматься как уходящий в прошлое артефакт и становится частью современной цифровой реальности».

Не просто перевод: голос и будущие экосистемы

Проект не ограничивается добавлением перевода новых языков. Параллельно развиваются и другие технологии. Так, для башкирского, марийского, чувашского и удмуртского языков в сервис добавлены технологии синтеза и распознавания речи, что позволяет не только переводить текст, но и озвучивать его или использовать голосовой ввод. Качество перевода для марийского и удмуртского языков было существенно улучшено.

Как отмечает Александр Болховитянов, руководитель проекта локализации продуктов «Яндекса» на языки народов России, в планах на 2026 год — добавить еще 6 языков и расширить пул языков с голосовыми технологиями. Но и это не предел. Тимур Цыбиков видит в этом лишь начало: «Цифровизация языков перестает быть набором разрозненных инициатив и превращается в целостную экосистему. Появление языков в сервисе является лишь первым шагом к появлению более сложных электронных инструментов и систем проверки орфографии, технологий синтеза и распознавания речи, создания больших языковых моделей и голосовых помощников».

Яркий пример такого углубления — проект в Югре. Михаил Русанов рассказывает о создании вопрос-ответной системы «А ги», которая общается на языке манси. А на федеральном уровне в декабре 2025 года Яндекс и Марийский государственный университет подписали меморандум о сотрудничестве для обучения ИИ на этнографических данных марийской культуры.

Фото: ФАДН России.

Фото: ФАДН России.

Сложности «колоссального масштаба» и работа энтузиастов

Техническая сторона проекта — это всегда вызов. Александр Болховитянов поясняет: «Работа над каждым языком — сложный и трудоемкий процесс. Для запуска модели машинного перевода нужны большие и качественные корпуса текстов». Минимальный порог — 100 тысяч параллельных предложений, но для многих языков такого объема просто нет в цифровом виде. На помощь приходят технологические ухищрения: обучение на родственных языках и метод обратного перевода.

Регионы, языки которых обладают уникальной грамматикой, столкнулись с особыми трудностями. Мурат Есенеев, министр Карачаево-Черкесской Республики по делам национальностей, массовым коммуникациям и печати, объясняет на примере языков республики: «Кабардино-черкесский и абазинский — языки с невероятно сложной фонетикой (десятки согласных при минимуме гласных) и полисинтетическим строем, где целое предложение может быть выражено одним многосоставным словом. Передать эти тонкости алгоритму — задача колоссальной сложности».

Ключевую роль в преодолении этих сложностей играют люди. «Драйверами цифровизации языков народов России выступают языковые активисты», — сообщил Тимур Цыбиков. Эту мысль поддерживает и представитель Яндекса: «Отдельную большую роль играют энтузиасты — носители языков. Благодаря их инициативности языки сохраняют присутствие как локально, так и в сети». Именно они часто являются первоисточником живых, актуальных текстов.

Практическая польза: мотивация, образование и единство

Главный итог проекта — не сухая статистика, а реальные изменения. Для Карачаево-Черкесии, как отмечает Мурат Есенеев, это укрепление концепции «двуединой языковой идентичности»: «Переводчик укрепляет оба звена этой цепи: малые языки получают цифровое бессмертие, а через русский как язык-мост их культура становится понятнее всей стране». Сервис становится инструментом для учителей и мощным мотиватором для школьников.

Для сообщества манси, как подчеркивает Михаил Русанов, появление в переводчике напрямую влияет на мотивацию молодежи: «Если их родного языка нет в смартфоне под рукой, то он рискует остаться для них языком «бабушек и дедушек». Интеграция в Яндекс – это способ сказать: «Ваш язык – современный и крутой»».

Фото: ФАДН России.

Фото: ФАДН России.

«Проект делает языки народов России доступными для широкой аудитории, способствует их развитию и повышает к ним интерес», — резюмирует Александр Болховитянов. А Тимур Цыбиков приводит конкретную цифру: технология уже сегодня открывает возможности для создания цифрового контента на родном языке более чем 10 миллионам носителей.

Работа, начатая с простой, но жизненно важной цели — преодолеть цифровое неравенство, — вышла на новый уровень. Из разрозненных усилий она превратилась в системную стройку цифровой экосистемы для языкового многообразия России, где каждый новый язык, добавленный в переводчик, — это не конец пути, а уверенный шаг в будущее.